Linux进程的一些知识干货

您所在的位置：网站首页 › linux 组管理 › Linux进程的一些知识干货

Linux进程的一些知识干货

2023-03-22 04:40| 来源: 网络整理| 查看: 265

【推荐阅读】

Linux文件系统详解

linux进程管理---实时调度

linux内核内存管理-缺页异常

linux内核内存管理-brk系统调用

1、进程的创建：

一般使用fork、vfork或者clone创建进程。

进程号PID：标志进程的一个非负整型数。getpid()

父进程号PPID：任何进程（除了init进程，进程号为1，进程号为0的是调度进程）都是由另一个进程创建，该进程称为被创建进程的父进程，其对应的进程号就是父进程号。getppid()

进程组号PGID：进程组是一个或多个进程的集合。他们之间相互关联，进程组可以接收同一终端的各种信号，关联的进程有一个进程组号PGID。getpgid()

fork函数

定义：pid_t fork(void); 返回值：若成功调用一次则返回两个值，子进程返回0，父进程返回子进程ID；否则，出错返回-1。使用fork函数得到的子进程是父进程的一个复制品，它从父进程处继承了整个进程的地址空间，包括进程上下文、进程堆栈、打开的文件描述符、信号控制设定、进程优先级、进程组号等。例如，要是父进程打开了五个文件，那么子进程也有五个打开的文件，而且这些文件的当前读写指针也停在相同的地方。所以，这一步所做的是复制。这样得到的子进程独立于父进程，具有良好的并发性，但是二者之间的通讯需要通过专门的通讯机制。子进程所独有的只有它的进程号、计时器等。使用fork函数的代价是很大的，这些开销并不是所有的情况下都是必须的。比如某进程fork出一个子进程后，其子进程仅仅是为了调用exec执行另一个可执行文件，那么在fork过程中对于虚存空间的复制将是一个多余的过程。但由于现在Linux中是采取了copy-on-write(COW写时复制)技术，为了降低开销，fork最初并不会真的产生两个不同的拷贝，因为在那个时候，大量的数据其实完全是一样的。写时复制是在推迟真正的数据拷贝。若后来确实发生了写入，那意味着parent和child的数据不一致了，于是产生复制动作，每个进程拿到属于自己的那一份，这样就可以降低系统调用的开销。所以有了写时复制后，vfork其实现意义就不大了。在fork之后，子进程和父进程都会继续执行fork调用之后的指令。子进程是父进程的副本。它将获得父进程的数据空间，堆和栈的副本，这些都是副本，父子进程并不共享这部分的内存。也就是说，子进程对父进程中的同名变量进行修改并不会影响其在父进程中的值。但是父子进程又共享一些东西，简单说来就是程序的正文段。正文段存放着由cpu执行的机器指令，通常是read-only的。值得注意的是，子进程也是继承父进程的缓冲区的（全缓冲，在填满标准I/O缓冲区后，才进行实际的I/O操作；行缓冲，在遇到换行符时，标准I/O库进行实际I/O 操作。），所以打印输出时在不进行特殊处理的情况下会出现交叉打印。有些打印函数，如printf，在输出到屏幕上时是行缓冲，但是重定向输出到文件中却变成了全缓冲。比如程序a.out中使用了printf进行输出，如果a.out > log，则printf是按照全缓冲处理的。

vfork函数

定义：pid_t vfork(void);

vfork和fork的区别：

vfork保证子进程先运行，父进程会被阻塞直到子进程调用exec或exit之后，父进程才可能被调度运行。vfork和fork一样都创建一个子进程，但它并不将父进程的地址空间完全复制到子进程中，因为子进程会立即调用exec（或者exit），于是也就不访问该地址空间。相反，在子进程调用exec和exit之前，它在父进程的地址空间中运行，在exec之后子进程会有自己的进程地址空间。

注意：在fork中用return语句是允许的，因为子进程是复制了一份数据。然而，在vfork中用return语句，因为父子进程共享地址空间，子进程return会引起弹栈，导致栈的破坏，也就是父进程不能够继续执行下去了。因此，在vfork中需要用exit()函数或者_exit()函数exec族函数。

clone函数

定义：int clone(int (*fn)(void *), void *child_stack, int flags, void *arg);

系统调用fork()和vfork()是无参数的，而clone()则带有参数。fork()是全部复制，vfork()是共享内存，而clone() 是则可以将父进程资源有选择地复制给子进程，而没有复制的数据结构则通过指针的复制让子进程共享，具体要复制哪些资源给子进程，由参数列表中的 clone_flags来决定。另外，clone()返回的是子进程的pid。

CLONE_PARENT 创建的子进程的父进程是调用者的父进程，新进程与创建它的进程成了“兄弟”而不是“父子” CLONE_FS 子进程与父进程共享相同的文件系统，包括root、当前目录、umask CLONE_FILES 子进程与父进程共享相同的文件描述符（file descriptor）表 CLONE_NEWNS 在新的namespace启动子进程，namespace描述了进程的文件hierarchy CLONE_SIGHAND 子进程与父进程共享相同的信号处理（signal handler）表 CLONE_PTRACE 若父进程被trace，子进程也被trace CLONE_VFORK 父进程被挂起，直至子进程释放虚拟内存资源 CLONE_VM 子进程与父进程运行于相同的内存空间 CLONE_PID 子进程在创建时PID与父进程一致 CLONE_THREAD Linux 2.4中增加以支持POSIX线程标准，子进程与父进程共享相同的线程群

例子：

#include 　　#include 　　#include 　　#include 　　#include 　　#include 　　#include 　　int variable,fd; 　　int do_something(){ 　　variable = 42; 　　printf("in child process\n"); 　　close(fd); 　　return 0; 　　} 　　int main(int argc, char *argv[]){ 　　void *child_stack; 　　char tempch; 　　variable = 9; 　　fd = open("/test.txt",O_RDONLY); 　　child_stack = (void *)malloc(16384); 　　printf("The variable was %d\n",variable); 　　clone(do_something, child_stack+10000, CLONE_VM |CLONE_FILES,NULL); 　　sleep(3); /* 延时以便子进程完成关闭文件操作、修改变量 */ 　　printf("The variable is now %d\n",variable); 　　if(read(fd,&tempch,1) < 1){ 　　perror("File Read Error"); 　　exit(1); 　　 } 　　printf("We could read from the file\n"); 　　return 0; 　　} 　　运行结果：　　the value was 9 　　in child process 　　The variable is now 42 　　File Read Error【文章福利】小编推荐自己的Linux内核技术交流群：【977878001】整理一些个人觉得比较好得学习书籍、视频资料！进群私聊管理领取内核资料包（含视频教程、电子书、实战项目及代码）

内核资料直通车：Linux内核源码技术学习路线+视频教程代码资料

学习直通车：Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈

2、sleep函数

进程挂起指定的秒数，直到指定的时间用完或者收到信号才解除挂起。注意：进程挂起指定的秒数后程序并不会立即执行，系统只是将此进程切换到了就绪态。

3、wait函数

工作原理：

父进程调用wait函数后阻塞，子进程结束时，系统向其父进程发送SIGCHILD信号。父进程被SIGCHILD信号唤醒然后去回收僵尸子进程，父子进程之间是异步的，SIGCHILD信号机制就是为了解决父子进程之间的异步通信问题，让父进程可以及时的去回收僵尸子进程。若父进程没有任何子进程则wait返回错误。当前进程有可能有多个子进程，wait函数阻塞直到其中一个子进程结束wait就会返回，wait的返回值就可以用来判断到底是哪一个子进程本次被回收了。

pid_t wait(int *status); 功能：等待子进程终止，如果终止了，此函数会回收子进程的资源。调用wait函数的进程会挂起，直到它的一个子进程退出或收到一个不能被忽视的信号时才被唤醒。若调用进程没有子进程或它的子进程已经结束，该函数立即返回。参数：函数返回时，参数status中包含子进程退出时的状态信息。子进程的退出信息在一个int中包含了多个字段，用宏定义可以取出其中的每个字段。返回值：如果执行成功则返回子进程的进程号，出错返回-1，失败原因存于errno中。 1、WIFEXITED(status) 这个宏用来指出子进程是否为正常退出的，如果是，它会返回一个非零值。 2、WEXITSTATUS(status) 当WIFEXITED返回非零值时，我们可以用这个宏来提取子进程的返回值，如果子进程调用exit(5)退出，WEXITSTATUS(status) 就会返回5；如果子进程调用exit(7)，WEXITSTATUS(status)就会返回7。请注意，如果进程不是正常退出的，也就是说， WIFEXITED返回0，这个值就毫无意义。

waitpid函数

pid_t waitpid(pid_t pid, int *status,int options) - pid>0时，只等待进程ID等于pid的子进程，不管其它已经有多少子进程运行结束退出了，只要指定的子进程还没有结束，waitpid就会一直等下去。 - pid=-1时，等待任何一个子进程退出，没有任何限制，此时waitpid和wait的作用一模一样。 - pid=0时，等待同一个进程组中的任何子进程，如果子进程已经加入了别的进程组，waitpid不会对它做任何理睬。 - pid

6、exec函数族

int execl(const char *path, const char *arg, ...); int execlp(const char *file, const char *arg, ...); int execle(const char *path, const char *arg, ..., char *const envp[]); int execv(const char *path, char *const argv[]); int execvp(const char *file, char *const argv[]); int execve(const char *path, char *const argv[], char *const envp[]);

exec函数族的作用是根据指定的文件名找到可执行文件，并用它来取代调用进程的内容，换句话说，就是在调用进程内部执行一个可执行文件。这里的可执行文件既可以是二进制文件，也可以是任何Linux下可执行的脚本文件。

与一般情况不同，exec函数族的函数执行成功后不会返回，因为调用进程的实体，包括代码段，数据段和堆栈等都已经被新的内容取代，只留下进程ID等一些表面上的信息仍保持原样。只有调用失败了，它们才会返回一个-1，从原程序的调用点接着往下执行。所以通常我们直接在exec函数调用后直接调用perror()和exit()，无需if判断。

pid_t processId = fork(); if (processId > 0) { return processId; //父进程 } else if (processId < 0) { return -1; //出错 } else { //子进程 char* execv_str[] = {"echo", "executed by execv", NULL}; execv("/usr/bin/echo", execv_str); _exit(127); //execv调用失败，返回-1，从此处重新开始运行，直接结束子进程 }

每当有进程认为自己不能为系统和用户做出任何贡献了，他就可以调用任何一个exec，让自己以新的面貌重生；或者，更普遍的情况是，如果一个进程想执行另一个程序，它就可以fork出一个新进程，然后调用任何一个exec，这样看起来就好像通过执行应用程序而产生了一个新进程一样。

事实上第二种情况应用得很普遍，以至于Linux专门为其作了优化，我们知道，fork会将调用进程的所有内容原封不动的拷贝到新产生的子进程中去，这些拷贝的动作很消耗时间，而如果fork完之后我们马上就调用exec，这些辛辛苦苦拷贝来的东西又会被立刻抹掉，这看起来非常不划算，于是人们设计了一种"写时拷贝（copy-on-write）"技术，使得fork结束后并不立刻复制父进程的内容，而是到了真正实用的时候才复制，这样如果下一条语句是exec，它就不会白白作无用功了，也就提高了效率。

带l的exec函数这类函数有：execl，execlp，execle 具体说明：表示后边的参数以可变参数的形式给出且都以一个空指针结束。这里特别要说明的是，程序名也是参数，所以第一个参数就是程序名。带p的exec函数这类函数有：execlp，execvp 具体说明：表示第一个参数无需给出具体的路径，只需给出函数名即可，系统会在PATH环境变量中寻找所对应的程序，如果没找到的话返回－1。带v的exec函数这类函数有：execv，execvp 具体说明：表示命令所需的参数以char *arg[]形式给出且arg最后一个元素必须是NULL 带e的exec函数这类函数有：execle 具体说明：将环境变量传递给需要替换的进程，原来的环境变量不再起作用。

事实上，只有execve是真正的系统调用，其它五个函数最终都调用execve，都是库函数。一个进程调用exec后，除了进程ID，进程还保留了下列特征不变：环境变量（使用了execle、execve函数则不继承环境变量）、父进程号、进程组号、附加组号、会话ID、文件锁、文件权限屏蔽字、控制终端、根目录、当前工作目录、进程信号屏蔽集、未处理信号，资源限制 ...

7、FD_CLOEXEC标记

子进程以写时复制（COW，Copy-On-Write）方式获得父进程的数据空间、堆和栈副本，这其中也包括文件描述符。刚刚fork成功时，父子进程中相同的文件描述符指向系统文件表中的同一项（这也意味着他们共享同一文件偏移量）。

接着，一般会调用exec执行另一个程序，此时会用全新的程序替换子进程的正文，数据，堆和栈等。此时，保存文件描述符的变量当然也不存在了，我们就无法关闭无用的文件描述符了。所以，通常会在fork子进程后在子进程中直接执行close，关掉无用的文件描述符，然后再执行exec。但是在复杂系统中，有时在fork子进程时已经不知道打开了多少个文件描述符（包括socket句柄等），此时进行逐一清理有很大难度。我们期望的是能在fork子进程前打开某个文件句柄时就指定好：“这个句柄在fork子进程后执行exec时就关闭”。这个方法就是所谓的 close-on-exec。

int fd=open("foo.txt",O_RDONLY); int flags = fcntl(fd, F_GETFD); flags |= FD_CLOEXEC; fcntl(fd, F_SETFD, flags);

这样，当fork子进程后，仍然可以使用fd。但执行exec后系统就会自动关闭子进程中的fd了。不过，在2.6.23版本后，open函数的flags参数可以传入O_CLOEXEC标记，这样的话就一步到位了！

示例1： #include #include #include extern char **environ; int main(int argc,char *argv[]) { int flag; int ret; flag = fcntl(1,F_GETFD,0); printf("1. close-on-exec is %d\n",flag); fcntl(1,F_SETFD,flag|FD_CLOEXEC); flag = fcntl(1,F_GETFD,0); printf("2. close-on-exec is %d\n",flag); ret = execve("/bin/ls",argv,environ); if(ret == -1) { printf("FAULT!\n"); } printf("AH!!!!!\n"); return 0; } 运行结果： 1. close-on-exec is 0 2. close-on-exec is 1 ./cloexec: write error: Bad file descriptor // 上面代码编译出来的文件名字叫cloexec.

系统调用exec函数是用来执行一个可执行文件来代替当前进程的执行映像。需要注意的是，这里并没有生成新的进程，而是在原有进程的基础上，替换原有进程的正文，调用前后是同一个进程，进程号PID不变，但执行的程序变了（执行的指令序列改变了）。因其在执行可执行文件的时候，在可执行文件结束有运行return，所以就不会再执行下边的printf("AH!!!!!\n")。加上FD_CLOEXEC后是关闭文件描述符1，也就是标准输出，所以ls运行的结果不会显示出来了，不加FD_CLOEXEC就会打印出ls的运行结果。

示例2： #include #include #include extern char **environ; int main(int argc,char *argv[]) { int flag; int ret; pid_t fpid; int count = 0; flag = fcntl(1,F_GETFD,0); printf("1. close-on-exec is %d\n",flag); fcntl(1,F_SETFD,flag|FD_CLOEXEC); flag = fcntl(1,F_GETFD,0); printf("2. close-on-exec is %d\n",flag); fpid = fork(); if (fpid < 0) printf("error in fork!"); else if (fpid == 0) { sleep(1); // 目的是为了让父进程的count先加2 printf("I am the child process, my process id is %d, count %d.\n", getpid(), count); ret = execve("/bin/ls",argv,environ); } else { printf("a. I am the parent process, my process id is %d, count %d.\n", getpid(), count); count += 2; sleep(5); // 目的是为了让子进程执行execve函数，关闭文件描述符，以此来观察是否会影响到下面这句话的输出 printf("b. I am the parent process, my process id is %d, count %d.\n", getpid(), count); ret = execve("/bin/ls",argv,environ); } return 0; } 运行结果： 1. close-on-exec is 0 2. close-on-exec is 1 a. I am the parent process, my process id is 48267, count 0. I am the child process, my process id is 48269, count 0. ./cloexec: write error: Bad file descriptor b. I am the parent process, my process id is 48267, count 2. // 5秒后输出 ./cloexec: write error: Bad file descriptor

子进程等待1秒，让父进程先运行，父进程打印出(a)这条语句，同时count加2，然后父进程等待5秒，让子进程运行。子进程打印结果count为0，表示父子进程count独立，父进程的加操作导致了子进程的count进行了写时复制操作。然后子进程进行了exec命令，子进程的标准输出文件描述符被关闭，ls命令无法输出，引起Bad file descriptor。5秒后，父进程恢复运行，继续输出(b)这条语句，表明子进程的exec命令并不影响父进程中标准输出文件描述符的运用。然后父进程执行exec命令，出现Bad file descriptor，表明父进程的exec让父进程的标准输出文件描述符关闭了！

综上可知，设置了FD_CLOEXEC后，如果执行了exec操作，只会关闭所在进程的文件描述符！

附1：

在 Linux 中进程和线程实际上都是用一个结构体 task_struct来表示一个执行任务的实体。进程创建调用fork 系统调用，而线程创建则是 pthread_create 方法，但是这两个方法最终都会调用到 do_fork 来做具体的创建操作，区别就在于传入的参数不同。Linux 实现线程的方式很巧妙，实际上根本没有线程，它创建的就是进程 ，只不过通过参数指定多个进程之间共享某些资源（如虚拟内存、页表、文件描述符等），函数调用栈、寄存器等线程私有数据则独立 。

但是在其它提供了专门线程支持的系统中，则会在进程控制块（PCB）中增加一个包含指向该进程所有线程的指针，然后再每个线程中再去包含自己独占的资源。这算是非常正统的实现方式了，比如 Windows 就是这样干的。但是相比之下 Linux 就显得取巧很多，也很简洁。

原文作者：首页 - 内核技术中文网 - 构建全国最权威的内核技术交流分享论坛

原文链接：Linux进程的一些知识干货 - 圈点 - 内核技术中文网 - 构建全国最权威的内核技术交流分享论坛（版权归原文作者所有，侵权留言联系删除）

【本文地址】

公司简介

联系我们